智能论文笔记

A Theoretical View on Sparsely Activated Networks

Cenk Baykal , Nishanth Dikkala , Rina Panigrahy , Cyrus Rashtchian , Xin Wang

分类：机器学习 | (统计)机器学习

2022-08-08

深层神经网络如今成功地拟合了非常复杂的功能，但是对于推理而言，密集的模型开始非常昂贵。为了减轻这种情况，一个有希望的方向是激活网络稀疏子图的网络。该子图是由数据依赖性路由函数选择的，将输入的固定映射到子网（例如，专家（MOE）在开关变压器中的混合物）。但是，先前的工作在很大程度上是经验的，尽管现有的路由功能在实践中效果很好，但它们并没有导致近似能力的理论保证。我们旨在为稀疏网络的力量提供理论解释。作为我们的第一个贡献，我们提出了一个与数据相关的稀疏网络的形式模型，该网络捕获了流行体系结构的显着方面。然后，我们基于局部性敏感哈希（LSH）引入一个路由函数，使我们能够对稀疏网络近似目标函数的方式进行推论。在用我们的模型代表基于LSH的稀疏网络之后，我们证明稀疏网络可以匹配Lipschitz函数上密集网络的近似能力。在输入向量上应用LSH意味着专家在输入空间的不同子区域中插值目标函数。为了支持我们的理论，我们根据Lipschitz的目标功能定义了各种数据集，并且我们表明，稀疏网络在活动数量数量和近似质量之间具有良好的权衡。

translated by 谷歌翻译

Do More Negative Samples Necessarily Hurt in Contrastive Learning?

Pranjal Awasthi , Nishanth Dikkala , Pritish Kamath

分类：机器学习 | (统计)机器学习

2022-05-03

噪声对比度估计的最新研究表明，从经验上讲，从理论上讲，尽管在对比度损失中拥有更多的“负样本”，但最初在阈值中提高了下游分类的性能，但由于“碰撞覆盖“贸易”，它都会损害下游性能-离开。但是，对比度学习中固有的现象是如此吗？我们在一个简单的理论环境中显示，通过从基础潜在类采样（由Saunshi等人引入（ICML 2019）），产生正对，表明表示（人口）对比度损失的下游性能实际上确实确实确实如此。不会随着负样本的数量降低。一路上，我们在框架中给出了最佳表示形式的结构表征，以进行噪声对比估计。我们还为CIFAR-10和CIFAR-100数据集的理论结果提供了经验支持。

translated by 谷歌翻译

AnnoBERT: Effectively Representing Multiple Annotators' Label Choices to Improve Hate Speech Detection

Wenjie Yin , Vibhor Agarwal , Aiqi Jiang , Arkaitz Zubiaga , Nishanth Sastry

分类：自然语言处理

2022-12-20

Supervised approaches generally rely on majority-based labels. However, it is hard to achieve high agreement among annotators in subjective tasks such as hate speech detection. Existing neural network models principally regard labels as categorical variables, while ignoring the semantic information in diverse label texts. In this paper, we propose AnnoBERT, a first-of-its-kind architecture integrating annotator characteristics and label text with a transformer-based model to detect hate speech, with unique representations based on each annotator's characteristics via Collaborative Topic Regression (CTR) and integrate label text to enrich textual representations. During training, the model associates annotators with their label choices given a piece of text; during evaluation, when label information is not available, the model predicts the aggregated label given by the participating annotators by utilising the learnt association. The proposed approach displayed an advantage in detecting hate speech, especially in the minority class and edge cases with annotator disagreement. Improvement in the overall performance is the largest when the dataset is more label-imbalanced, suggesting its practical value in identifying real-world hate speech, as the volume of hate speech in-the-wild is extremely small on social media, when compared with normal (non-hate) speech. Through ablation studies, we show the relative contributions of annotator embeddings and label text to the model performance, and tested a range of alternative annotator embeddings and label text combinations.

translated by 谷歌翻译

Computationally Light Spectrally Normalized Memory Neuron Network based Estimator for GPS-Denied operation of Micro UAV

Nishanth Rao , Suresh Sundaram , Varun Raghavendra

分类：机器人

2022-11-12

This paper addresses the problem of position estimation in UAVs operating in a cluttered environment where GPS information is unavailable. A model learning-based approach is proposed that takes in the rotor RPMs and past state as input and predicts the one-step-ahead position of the UAV using a novel spectral-normalized memory neural network (SN-MNN). The spectral normalization guarantees stable and reliable prediction performance. The predicted position is transformed to global coordinate frame which is then fused along with the odometry of other peripheral sensors like IMU, barometer, compass etc., using the onboard extended Kalman filter to estimate the states of the UAV. The experimental flight data collected from a motion capture facility using a micro-UAV is used to train the SN-MNN. The PX4-ECL library is used to replay the flight data using the proposed algorithm, and the estimated position is compared with actual ground truth data. The proposed algorithm doesn't require any additional onboard sensors, and is computationally light. The performance of the proposed approach is compared with the current state-of-art GPS-denied algorithms, and it can be seen that the proposed algorithm has the least RMSE for position estimates.

translated by 谷歌翻译

Efficient ML Models for Practical Secure Inference

Vinod Ganesan , Anwesh Bhattacharya , Pratyush Kumar , Divya Gupta , Rahul Sharma , Nishanth Chandran

分类：机器学习

2022-08-26

ML-AS-A-Service继续增长，对非常强大的隐私保证的需求也在继续增长。安全推断已成为潜在的解决方案，其中加密原始图允许推理不向用户向用户揭示用户的输入或模型的权重。例如，模型提供商可以是一家诊断公司，该公司已经培训了一种最先进的Densenet-121模型来解释胸部X射线，并且用户可以在医院成为患者。尽管对于这种环境，确保推理原则上是可行的，但没有现有的技术使其大规模实用。 Cryptflow2框架提供了一种潜在的解决方案，其能力自动，正确地将清晰文本推理转换为安全模型的推断。但是，从Cryptflow2产生的安全推断在不切实际上很昂贵：在Densenet-121上解释单个X射线需要几乎3TB的通信。在本文中，我们解决了针对三项贡献的安全推断效率低下的重大挑战。首先，我们证明安全推理中的主要瓶颈是大型线性层，可以通过选择网络骨干的选择来优化，并使用用于有效的清晰文本推理开发的操作员。这一发现和强调与许多最近的作品偏离，这些作品着重于在执行较小网络的安全推断时优化非线性激活层。其次，基于对瓶颈卷积层的分析，我们设计了一个更有效的倒入替代品的X操作器。第三，我们表明，快速的Winograd卷积算法进一步提高了安全推断的效率。结合使用，这三个优化被证明对在CHEXPERT数据集中训练的X射线解释问题非常有效。

translated by 谷歌翻译

Learning Operators with Ignore Effects for Bilevel Planning in Continuous Domains

Nishanth Kumar , Willie McClinton , Rohan Chitnis , Tom Silver , Tomás Lozano-Pérez , Leslie Pack Kaelbling

分类：人工智能 | 机器学习 | 机器人

2022-08-16

在环境抽象中进行高级搜索来指导低水平决策，这是一种有效的方法，是解决连续状态和行动空间中的长途任务的有效方法。最近的工作表明，可以以符号操作员和神经采样器的形式学习使这种二聚体计划的动作抽象，并且鉴于实现已知目标的符号谓词和演示。在这项工作中，我们表明，在动作往往会导致大量谓词发生变化的环境中，现有的方法不足。为了解决这个问题，我们建议学习具有忽略效果的操作员。激发我们方法的关键思想是，对谓词的每一个观察到的变化进行建模是不必要的。唯一需要建模的更改是高级搜索以实现指定目标所需的更改。在实验上，我们表明我们的方法能够学习具有忽略六个混合机器人域效果的操作员，这些企业能够解决一个代理，以解决具有不同初始状态，目标和对象数量的新任务变化，比几个基线要高得多。

translated by 谷歌翻译

An Input-Output Feedback Linearization based Exponentially Stable Controller for Multi-UAV Payload Transport

Nishanth Rao , Suresh Sundaram

分类：机器人

2022-07-10

在本文中，提出了一个稳定稳定的轨迹跟踪控制器，用于多uav有效载荷运输。多uav有效负载系统在无人机和有效负载框架的垂直刚性链接之间具有2DOF磁球接头，因此无人机可以自由滚动或自由投球。这些垂直链接紧密地连接到有效载荷上，无法移动。为完整的有效载体 - uav系统得出了输入输出反馈线性化模型以及有效载荷轨迹跟踪的推力矢量控制。关于跟踪控制定律的理论分析表明，控制定律是指数稳定的，从而确保了沿期望轨迹的安全运输。为了验证拟议的控制定律的性能，提供了数值模拟以及高保真凉亭实时仿真的结果。接下来，针对两种实际情况分析了提议的控制器的鲁棒性：有效载荷和有效载荷质量不确定性的外部干扰。结果清楚地表明，所提出的控制器在实现指数稳定的轨迹跟踪的同时具有稳健性和计算效率。

translated by 谷歌翻译

Discovery of the Content and Engagement with the Content

Pushkal Agarwal , Nishanth Sastry , Edward Wood

分类：机器学习

2022-06-15

在20世纪下半叶，议会允许广播公司传播广播，并最终对选定委员会的辩论和会议进行电视报道。最近，为了进一步提高透明度和公民参与，英国议会开始发布这些辩论和会议本身的视频，并在发生辩论的细节上发布了辩论的细节。在本文中，我们试图通过使用超过两年的Google Analytics（分析）数据来表征人们如何参与议会辩论的视频数据。我们分析参与模式 - 它们如何登陆特定视频？他们如何听到此视频，即导致用户单击视频的（HTTP）推荐程序网站是什么？一旦用户降落在视频上，他们将如何互动？播放视频多长时间？下一个目的地是什么？等等。回答这些问题是了解人们为什么以及如何使用议会视频的重要第一步，因此，应如何适应和个性化视频交付平台满足该国公民的需求。从An，Kwak和Jansen（2017）汲取灵感，我们采用了非负矩阵分解（NMF）（Lee and Seung，1999）在视频视图矩阵上识别不同的用户原型，并识别原型。对我们发现的原型进行更深入的研究表明，它们主要是由它们降落在视频页面上的方式：搜索（即通过搜索引擎），推荐（即，来自其他议会网站），直接（即通过直接的）链接，嵌入在另一个网站上），社交（即，通过Facebook或Twitter等社交平台）等。

translated by 谷歌翻译

QU-BraTS: MICCAI BraTS 2020 Challenge on Quantifying Uncertainty in Brain Tumor Segmentation -- Analysis of Ranking Metrics and Benchmarking Results

Raghav Mehta , Angelos Filos , Ujjwal Baid , Chiharu Sako , Richard McKinley , Michael Rebsamen , Katrin Dätwyler , Raphael Meier , Piotr Radojewski , Gowtham Krishnan Murugesan

分类：计算机视觉 | 机器学习

2021-12-19

深度学习（DL）模型为各种医学成像基准挑战提供了最先进的性能，包括脑肿瘤细分（BRATS）挑战。然而，局灶性病理多隔室分割（例如，肿瘤和病变子区）的任务特别具有挑战性，并且潜在的错误阻碍DL模型转化为临床工作流程。量化不确定形式的DL模型预测的可靠性，可以实现最不确定的地区的临床审查，从而建立信任并铺平临床翻译。最近，已经引入了许多不确定性估计方法，用于DL医学图像分割任务。开发指标评估和比较不确定性措施的表现将有助于最终用户制定更明智的决策。在本研究中，我们探索并评估在Brats 2019-2020任务期间开发的公制，以对不确定量化量化（Qu-Brats），并旨在评估和排列脑肿瘤多隔室分割的不确定性估计。该公制（1）奖励不确定性估计，对正确断言产生高置信度，以及在不正确的断言处分配低置信水平的估计数，（2）惩罚导致更高百分比的无关正确断言百分比的不确定性措施。我们进一步基准测试由14个独立参与的Qu-Brats 2020的分割不确定性，所有这些都参与了主要的Brats细分任务。总体而言，我们的研究结果证实了不确定性估计提供了分割算法的重要性和互补价值，因此突出了医学图像分析中不确定性量化的需求。我们的评估代码在HTTPS://github.com/ragmeh11/qu-brats公开提供。

translated by 谷歌翻译

Asteroid Flyby Cycler Trajectory Design Using Deep Neural Networks

Naoya Ozaki , Kanta Yanagida , Takuya Chikazawa , Nishanth Pushparaj , Naoya Takeishi , Ryuki Hyodo

分类：机器学习 | 神经与进化计算

2021-11-23

近年来，小行星勘探一直在吸引更多的关注。尽管如此，我们刚刚访问了数十天的小行星，而我们发现了超过一百万具体。由于我们目前的观察和知识应该偏向，因此必须直接探索多个小行星，以更好地了解行星建筑材料的遗体。其中一项任务设计解决方案正在利用具有多个地球重力辅助的小行星飞行循环轨迹。小行星飞行循环轨道轨迹设计问题是全局轨迹优化问题的子类，具有多种捕获问题，涉及给定的飞行序列的轨迹优化问题和组合优化问题来决定捕获的序列。随着飞行体的数量增长，这种优化问题的计算时间恶意地扩展。本文介绍了利用深神经网络构建的替代模型设计小行星飞行器轨迹的新方法，近似轨迹优化结果。由于机器学习方法的瓶颈之一是产生大量轨迹数据库，因此我们通过引入满足Karush-Kuhn-Tucker条件的伪小行星提出了高效的数据库生成策略。应用于JAXA的命运+任务的数值结果表明，所提出的方法可以显着降低搜索小行星飞溅序列的计算时间。

translated by 谷歌翻译